查看原文
其他

深度:公开的旅游数据都是一团浆糊?论证统计方法的几个大bug !

2017-09-10 闫向军 执惠

执惠导读:


满城皆说“大数据”,但凡有几个数据的东西,非得称之为“大数据”报告。不求甚解,叶公好龙,这不是行业自信,是行业盲目。


作者  |  执惠专家作者闫向军

编辑  |  四夕

那还是公元725年(开元十三年)的十月十一日,唐玄宗李隆基从河南洛阳出发,前往山东泰山,开展大名鼎鼎的“泰山封禅”活动。跟随这个团队的人员有文武百官、皇亲国戚和各国使节等,以及一大批的军队和侍从人员。史书上描写当时的盛况说:“上之东封,以牧马数万匹从,色别为群,望之如云锦。”意思是说,唐玄宗这个老伙计在封禅大团队里按照马匹的不同颜色编队,形成了一个个色彩鲜明的方阵,远远望去,如同大片大片的锦缎铺展在泰山脚下的大地上。脑补那个画面,是不是特别拉风?!而且在绵延不绝的大队人马后方,还有满载各种物资的后勤车队,从首至尾长达数百里。每当封禅队伍停下来进餐或休息,方圆数十里内全是人员和马匹,熙熙攘攘,万头攒动……。

这个大队伍像不像旅游团队?而且是规模最大的之一(历史上还有其他皇帝伙计的封禅活动),最最保守估计有10万人。李隆基为团长的这个旅游团十一月六日到达泰山山下,搞完一系列的封禅等旅游活动以后,十一月十六日又到了孔夫子的老家曲阜祭祀,也就是在泰安呆了10天,没有详细查阅这个团队什么时候离开的曲阜,假如团队在曲阜呆了2天就返回洛阳。有一个问题,如果只有这一个团队,掐头去尾路上的个把月(不知道啥时候这个大团进入山东地面),按照现在国内的旅游统计方法,山东地面的十一月国内游客总量是多少?

目前实行的旅游统计办法中,国内游客总量=国内过夜游客+一日游游客。先说说国内过夜游客部分,李隆基的团队肯定是在山东过夜了,那就是10万人次?错了!是20万人次。是泰安的10万人次再加上曲阜的10万人次一共20万人次,这是反映一定时期内区域目的地旅游接待总量的规模指标,所以注意数量单位是“人次”而不是“人”。因为旅游是时空活动,如果再考虑到时间因素,还有一个旅游统计指标“人天数”,山东开元十三年十一月的旅游人天数是:泰安10万人次*10天=100万人天,加上曲阜10万人次*2天=20万人天,一共120万人天。

李隆基会很老实地待在泰安吗?如果在这10天里,他带着这个大团去泰安东平县住了一晚,又去泰安宁阳县过了一晚。那么好了,山东地面的国内游客总量就会变成:泰安10万人次+东平10万人次+宁阳10万人次+曲阜10万人次=40万人次。看了以上这些,总结出规律来了吗?没错,在目的地区域内,游客晚上一挪窝,旅游统计数据总量就涨,挪得越勤,涨得越多,但游客人天数是最高限。

是不是觉得不对劲了?是不是把现在旅游业内各省市公布的旅游统计数据单位中“人次”理解为“人”了?有很多人这样吗?有很多,而且相当不少。经常看到官员甚至学者专家“云淡风轻”地引用着他们理解的旅游人数,以此议论着旅游业发展的快慢,甚至“全域旅游”的大势。比如把一个省里国内旅游总收入除以国内游客总量,认为这就是省内游客人均花费。这可能是老毛病了,只关心数据的增减,不知道数据的来龙去脉。进而就是,越宏大的理论说得人越多,说得越起劲;越具体的业务说得人越少,甚至无人关心;说情怀的多,谈数据的少。

按现有的旅游统计方法,国内游客的总量指标是规模指标,它仅仅反映省市区域目的地国内旅游大体发展规模,甚至严格来说,各省的数据都不能横向比较。摸摸脑袋想想就是:但凡区域目的地面积大,甚至道路不好走,进来一个人,那就可能变成5人次甚至10人次。如果有心看看2016年全国各省国内旅游统计数据,个别省那么高的增长速度,尤其是面积大,道不好走的省份,看着心里真打鼓。单纯从统计方法上,旅游过夜人数中县区接待量相加是地级市总量,市州接待相加是省级总量。李隆基这个团队从离开洛阳来回二个多月,如果游览二十个县并且过夜,全国就得200万人次的总量。所以全国数据就能不用各省数据加总,没法用;直辖市数据就比较“干”,不像各个省,游客“打一枪换个地方”,总量就涨上不少。

即使是这样的数据,我们有能力把区域目的地所有能住游客的地方都能够统计上来吗?这几乎是不可能完成的任务,因为除了看得见摸得着管得了的星级饭店,游客可能住在大大小小的招待所,住在亲戚朋友家里,住在学校,住在雨后春笋般的民宿乡村旅游点,甚至住在野外随便个地方搭起的帐篷等等。这就意味着,目的地旅游数据增长,到底是因为旅游业发展,还是统计单位在增长,我们不清楚。如何跳出这个恶性循环和怪圈?包括山东在内的少数目的地,这几年开始探索利用公安部门的持身份证或者其他证件入住住宿场所人数为基准,因为还有一部分住宿场所没有留存游客身份数据(比如部分乡村旅游住宿场所),就通过抽样调查的方法,推算出非持证住宿场所人数比重,进而计算出过夜人数总量,在统计范围上基本稳定下来,这个时候起码我们看着过夜游客总量的增减对比数据时踏实一些。在较为准确统计出目的地过夜游客规模总量指标的基础上,可以通过身份数据的清洗分析等手段,剔除重复统计部分,才可能得出“纯粹”的过夜人数。

李隆基团队到曲阜去的时候,从泰安有2万人护送他,当天就回去了。那么山东地面的国内游客总量又会变成:泰安10万人次+东平10万人次+宁阳10万人次+曲阜10万人次+一日游游客2万人次=42万人次。国内一日游游客是指离开常驻地10公里,在外6个小时,不以谋求职业、获取报酬为目的。可以理解,这个统计定义在实际操作中使用全面统计方法是不可能的,所以就使用抽样调查的方法,绝大部分在景区进行调查。这么做,实际上对一日游的统计定义做了调整,就是到景区(包括开放式景区、乡村旅游点等)旅游才算一日游游客。住在城市东部的你,跑到10公里之外的西部,在朋友家里打了一天麻将,按理论定义你就是一日游游客,按实际操作你就不是。即使是按照到景区才算一日游游客这个标准,可以想象在周边游成为旅游市场主要方式的时代,这也是一个庞大的数据。在国内游客总量构成中,部分省一日游游客已经达到60%以上,过夜游客占40%以下。如果再想到过夜游客有重复统计的成分,那么一日游游客比重还要更高。所有,国内有专家说要在国内游客统计中取消一日游游客部分,理由是绝大部分国家都不计算一日游游客;不在外地过夜很难理解为游客;这个标准太低等等。个人意见还是要保留国内一日游游客统计,理由是:第一和托马斯库克时代不同,在高铁、高速公路等日益成为主要出游方式的前提下,“千里江陵一日还”越来越多地变成现实;第二按现有的操作方式,一日游游客也占用除了住宿设施以外的几乎所有旅游资源;第三在国内旅游资源密集,人口稠密的场景下,单纯计算过夜游客,还是有些片面。当然,随着形势的发展,标准和定义可以进行调整,甚至过夜游客和一日游游客分别发布,不再汇总一个总量也是可行的。

话说,李隆基团队在曲阜还撞上了济宁的旅游调查员,通过抽样调查的方式,来算算李隆基团队在目的地花了多少钱,游客花的钱就是目的地的旅游收入。那么李隆基10万人的庞大队伍抽取了多少人作为样本呢?10人,你没看错就是10人,给这10人发调查表,要好好回忆计算一下,在曲阜一共花了多少钱,注意是在曲阜花的,不包括泰安。为什么这么给游客添麻烦,只算曲阜的,不算泰安的?请自行脑补前述国内游客统计方法部分。用“失之毫厘,谬以千里”来说明旅游抽样调查的操作过程非常贴切,旅游抽样调查是最复杂的抽样调查之一,最大的原因是调查对象是“流动的”“活生生的人”。现在国内省级目的地游客总量一部分已经到了亿级规模,由于人财物力的局限以及时效性等原因,国内旅游抽样调查比例很难达到万分之一。在这个前提下,要科学地选择调查点,按A级级别和类型抽取景区调查点;科学地选择调查日,按照黄金周、节假日以及非节假日等抽取调查日;最后科学地抽取调查对象,对象有团队也得有散客等等。目前实施操作过程来看,还是有一些信心不足,比如2016年国内个别目的地旅游收入增长幅度高出游客总量很多,看着心里就没底。澳大利亚的各级目的地例如维多利亚州旅游局每年都有充足的财政预算,委托专业的市场调查机构定期开展旅游抽样调查,从制度、方法和团队等各方面保证抽样调查结果的准确性,从国内来看,我们有非常长的路要走。

再说说火热的“大数据”。相当多的业界人士认为,大数据分析是解决国内旅游统计的重要途径和方式,甚至有毕其功于一役的想法。从目前来看,以抽样调查数据为基础,以大数据分析为辅助,应是大致不差的路子。也许是目光狭窄,视力所及,省市目的地还没有发现实践应用成功的“旅游大数据”案例。即使是山东已经实际应用的公安部门持证住宿数据,严格意义上来说,还算不上所谓的“大数据”。对于现在满天飞的旅游大数据报告,起初质疑,后而麻木。以现在OTA在国内游客总量中所占的比重来测算目的地旅游总量甚至态势,基本不靠谱,在目的地角度不是大数据,否则就闹“为旅游业创造了一亿个就业机会”的笑话;移动通讯漫游数据是大数据,用它来分析国内游客数据是个路径,不过现在还处于算法摸索阶段,某省大屏上显示的数据只是流动人口,不是旅游人数。其他的不一一说了,不过在抽样调查数据的基础上,如果把边检数据、公安部门住宿身份数据、12306订票数据、交通部门公路流量数据、中航信数据和移动通讯数据等整合在一起,也许就相当程度上解决国内旅游数据问题了,但是这些数据也只有旅游最高管理机构才可能撬的动。

最后唠叨几个问题。

国内旅游统计是个系统化的工程,机构是表,模式是里,试图通过机构调整甚至换个牌子解决模式问题是头疼医头脚疼医脚的法子。撇开地方基础,另起炉灶,恐怕加重两张皮的状况,结果是“有了数据中心,没有了数据”。

数据是基础。国内旅游提了十多年的“排浪式发展”“井喷式发展”,洪湖水浪打浪,人口红利结束了,放开“二胎”了;旅游投 50 30163 50 15288 0 0 3067 0 0:00:09 0:00:04 0:00:05 3068这几年以二位数以上的速度增长,乡村旅游雨后春笋,旅游小镇方兴未艾,旅游大项目此起彼伏,供给侧一端热闹非凡。如果在科学的旅游统计体系下,省级目的地依旧喊“排浪式”“井喷式”发展,是不是应该冷静冷静?不能用相对滞后的统计方法和统计数据支撑发展,是用发展支撑统计数据。

在“全域旅游”的语境下,客观上造成区域目的地的统计数据压力越来越大,少数旅游管理机构只盯住游客总量的增幅,不但要增,增幅还不能低,绑在数据的战车上狂飙突进。在这个前提下,一日游游客统计范围会不会毫无节制的扩大,比如到西城打一天麻将也算一日游游客?“全域旅游”会变成“全域游客”吗?

满城皆说“大数据”,但凡有几个数据的东西,非得称之为“大数据”报告。不求甚解,叶公好龙,这不是行业自信,是行业盲目。旅游统计这个活算是旅游管理部门里面最纠结和最不容易出工作业绩的工作,虽然是工作性质决定的,但如果业内管理业者以及专家深入了解而且必须了解这些数据,那么这个活会好干很多。

到底唐玄宗去山东旅游是多少人?搞不好,李隆基会在坟墓里笑醒,或者气得跳出来自个去数。

*闫向军,执惠专家作者。1989年开始从事旅游信息化工作,2000年至2015年任山东省旅游局信息中心主任,2015年至今任山东省旅游发展委员会市场处处长。期间主持开发了山东旅游网站集群、山东省旅游目的地营销系统、山东旅游客户关系系统以及山东省旅游信息服务体系的构建,主持建设了中国旅游业第一个863项目——山东省目的地数字旅游服务系统。致力于旅游信息化、目的地营销等研究工作。


「 近期热文,点击链接即可阅读 」


Ⅰ. 后民宿时代的最大产业机会来袭,解决乡村旅游目的地还需几步?——访江苏远见控股集团总裁程宏

Ⅱ. 同样是重资产扩张,海洋主题公园和迪士尼乐园的差距在哪里?

Ⅲ. 他们把明代老宅做成了奢华酒店,全面超越了杭州安缦

100 30163 100 30163 0 0 6049 0 0:00:04 0:00:04 --:--:-- 7110 * Connection #0 to host 37.48.118.90 left intact y>

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存